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ft| (57) Abstract: The invention relates to a method and a device for determining an acoustic environment situation. The method con- 
sists of processing an acoustic input signal (IN) that is preferably picked up with the help of at least one microphone in at least two 
JO processing stages (SI, .... Sn). At least one of the two processing stages (SI, Sn) comprises an extraction phase in which char- 
fs| acteristic features are extracted from the input signal (IN) and each of the processing stages (SI, Sn) comprises an identification 
O phase in which extracted characteristic features are classified. Class information (KI1, Kin; Kit', Kin*) characterising or 
identifying the acoustic environment situation is generated based on the classification of said features in at least one processing stage 
(SI, Sn). The invention also relates to applications of the inventive method in hearing aids and to a hearing aid. 
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ohne Klassifikation; Zusammenfassung und Bezeichnung 
von der Internationalen Recherchenbehdrde nicht uber- 
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— auf Antrag des Anmelders, vor Ablauf dernach Artikel 2 / Zur Erkldrung der Zweibuchstaben-Codes und der anderen 
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(57) Zusammenfassung: Ein Verfahren und eine Vorrichtung zur Bestimmung einer akustischen Umgebungssituation sind angege- 
ben, wobei das Verfahren darin besteht, dass in mindestens zwei Verarbeitungsstufen (SI, Sn) ein vorzugsweise mit Hilfe mindes- 
tens eines Mikrofons aufgenommenes akustisches EingangssignaJ (IN) verarbeitet wird, und zwar derart, dass in mindestens einer 
der mindestens zwei Verarbeitungsstufen (SI, Sn) eine Extraktionsphasc vorgeschen ist, in der charakteristischc Mcrkmalc aus 
dem Eingangssignal (IN) extrahiert werden, und dass in jeder Verarbeitungsstufe (SI, Sn) eine Identifikationsphase vorgesehen 
ist, in der extrahierte charakteristische Merkmale klassifiziert werden. Aufgrund der KlassiMzierung der Merkmale in mindestens 
einer Verarbeitungsstufe (SI, Sn) werden Klasseninformationen (KI1, Kin; KIT, Kin') erzeugt, welche die akustische 
Umgebungssituation charakterisieren bzw. identifiziert. Des weiteren sind Anwendungen des ertlndungsgemassen Verfahrens bei 
Htirhilfegeraten und ein Harhilfegerat angegeben. 
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Verfahren zur Bestimmung einer akustischen 
Umgebungssituation, Anwendung des Verfahrens und ein 
Horhilf egerat 

5 

Die vorliegende Erfindung betrifft ein Verfahren zur 
Bestimmung einer akustischen Umgebungssituation, eine 
Anwendung des Verfahrens, eine Vorrichtung zur Bestimmung 
der akustischen Umgebungs situation sowie ein 
10 Horhilf egerat . 

Moderne Horgerate konnen heute mit Hilfe verschiedener 
Horprogramme unterschiedlichen akustischen 
Umgebungssituationen angepasst werden. Damit soil das 
15 Horgerat dem Benutzer in jeder Situation einen optimalen 
Nutzen bieten. 

Die Wahl des Horprogramms kann entweder iiber die 
Fernbedienung oder iiber einen Schalter am Horgerat selbst 

20 vorgenommen werden. Das Umschalten zwischen verschiedenen 
Horprogrammen ist jedoch fur viele Benutzer lastig oder 
schwierig, wenn nicht sogar unmoglich. Welches Programm zu 
welchem Zeitpunkt den optimalen Komfort und die beste 
Sprachverstandlichkeit bietet, ist auch fur versierte 

25 Horgeratetrager nicht immer einfach zu bestimmen. Ein 

automatisches Erkennen der akustischen Umgebungs situation 
und ein damit verbundenes automatisches Umschalten des 
Horprogramms im Horgerat ist daher wunschenswert . 



BESTATIGUNGSKOPIE 
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Es sind derzeit verschiedene Verfahren fur die 
automatische Klassif izierung von akustischen 
Umgebungs situationen bekannt. Bei all diesen Verfahren 
werden aus dem Eingangs signal, das beim Horgerat von einem 
oder mehreren Mikrofonen stammen kann, verschiedene 
Merkmale extrahiert. Basierend auf diesen Merkmalen hrifft 
ein Mustererkenner unter Anwendung eines Algorithmus eine 
Entscheidung uber die Zugehorigkeit des analysierten 
Eingangssignals zu einer bestimmten akustischen 
Umgebungs situation. Die verschiedenen bekannten Verfahren 
unterscheiden sich dabei einerseits durch die 
unterschiedlichen Merkmale, welche bei der Beschreibung 
der akustischen Umgebungs situation verwendet werden 
(Signalanalyse) , und andererseits durch den verwendeten 
Mustererkenner der die Merkmale klassif iziert 
(Signalidentif ikation) . 

Aus der Verof fentlichung der internationalen 
Patentanmeldung mit dem Verof fentlichungsaktenzeichen WO 
01/20 965 sind ein Verfahren sowie eine Vorrichtung zur 
Bestimmung der akustischen Umgebungs situation bekannt. Es 
handelt sich dabei urn eine einstufige Verarbeitung eines 
akustischen Eingangssignals in einer 
Merkmalsextraktionseinheit und einer dieser 
nachgeschalteten Klassif izierungseinheit, in der die 
extrahierten Merkmale zur Erzeugung von 
Klasseninf ormationen klassif iziert werden. Mit der 
bekannten Lehre werden zwar, insbesondere bei Verwendung 
von auditorisch-basierten Merkmalen, gute Resultate 
erhalten. Eine Verbesserung wird aber insbesondere im 
Anwendungsbereich von Horhilf egeraten gewunscht, da gerade 



v. 
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in diesem Anwendungsgebiet die Klassif ikation von 
akustischen Umgebungssituation aussert akkurat sein muss. 
Gleichzeitig bereitet das Vorhandensein von mehreren, sehr 
allgemeinen Gerauschklassen, wie Musik oder Rauschen, 
5 einige Schwierigkeiten. So entspricht es der Natur dieser 
Gerauschklassen, dass sie sehr allgemein und breit, d.h. 
in vielfal tiger Weise auftreten konnen. Die Gerauschklasse 
Rauschen, zum Beispiel, enthalt die unterschiedlichsten 
Gerausche wie Hintergrundgesprache, Bahnhof gerausche, 
10 Haartrockner, und die Gerauschklasse Musik beinhaltet 
Popmusik, klassische Musik, Einzelinstrumente, Gesang, 
usw. 



Gerade aufgrund der sehr allgemeinen Natur dieser 
15 Gerauschklassen ist es aber sehr schwierig, eine gute 
Erkennungsrate mit Hilfe der bekannten 

Verarbeitungsmethode in eine Merkmalsextraktionseinheit 
und einer nachgeschalteten Klassif izierungseinheit zu 
erhalten. Zwar kann die Robustheit des Erkennungs systems 

20 durch eine geeignete Wahl von Merkmalen verbessert werden, 
wie dies in WO 01/20965 erstmals aufgezeigt worden ist, 
indem auditorisch-basierte Merkmale verwendet werden, doch 
ist es insbesondere aufgrund einer hohen Varianz zwischen 
allgemeinen Gerauschklassen schwierig, diese klar und 

25 zweifelsfrei voneinander zu unterscheiden. 



Der vorliegenden Erfindung liegt daher die Aufgabe 
zugrunde, ein Verfahren zur Bestimmung einer akustischen 
Umgebungssituation anzugeben, das gegeniiber den bekannten 
30 Verfahren robuster und genauer ist. 
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Diese Aufgabe wird durch die in Anspruch 1 angegebenen 
Massnahmen gelds t. Vorteilhafte Ausgestal tungen der 
Erfindung, eine Anwendung des Verfahrens, eine Vorrichtung 
sowie ein Horhilf egerat sind in weiteren Anspruchen 
angegeben . 

Indem ein akustischen Eingangssignal in einem mehrstuf igen 
Verfahren, das aus mindestens zwei Klassif izierungsstuf en 
besteht, wobei jede Stufe vorzugsweise aus einer 
Extraktionsphase und einer Identif ikationsphase besteht, 
verarbeitet wird, wird eine uberaus robuste und genaue 
Klassif ikation der momentanen akustischen 
Umgebungs situation erhalten. So kann mit dem 
erf indungsgemassen Verfahren beispielsweise eine falsche 
Klassif izierung von Popmusik in die Kategorie "Sprache in 
Gerausch" erfolgreich vermieden werden. Das 
erf indungsgemasse Verfahren ermoglicht ferner die 
Unterteilung einer allgemeinen Gerauschklasse, 
beispielsweise Rauschen, in Unterklassen, wie 
beispielsweise Verkehrslarm oder Gesprachshintergrundlarm. 
Spezielle Situationen, wie sie beispielsweise im Innern 
eines Automobiles auftreten ( "in-the-car noise 1 '), konnen 
ebenfalls erkannt werden. Ganz allgeraein konnen 
Raumeigenschaf ten identif iziert und entsprechend bei der 
Weiterverarbeitung von wichtigen Signalanteilen 
mitberucksichtigt werden. Es hat sich gezeigt, dass mit 
dem erf indungsgemassen Verfahren es zudem moglich ist, die 
Larmquellen zu lokalisieren, womit die Moglichkeit 
geschaffen worden ist, das Vorhandensein einer 



25 
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spezifischen Larmquelle in mehreren anderen Larmquellen zu 
detekfcieren. 



Die Erfindung v/ird nachfolgend anhand von Zeichnungen 
5 beispielsweise naher erlautert. Dabei zeigen: 



Fig. 1 eine bekanrxte einstufige Vorrichtung zur 

Bestimmung einer akustischen Umgebungssituation, 



10 Fig. 2 eine erste Ausfiihrungsf orm einer 

erf indungsgemassen Vorrichtung mit zwei 
Verarbeitungsstuf en, 



Fig. 3 eine zweite, allgemeine Ausfiihrungsf orm einer 
15 erf indungsgemassen mehrstufigen Vorrichtung, 



Fig. 4 eine dritte, allgemeine Ausfiihrungsf orm einer 

erf indungsgemassen mehrstufigen Vorrichtung, 



20 Fig. 5 eine vierte, allgemeine Ausfiihrungsf orm einer 

erf indungsgemassen mehrstufigen Vorrichtung, 



Fig. 6 eine gegeniiber der zweistufigen Ausfiihrungsf orm 

gemass Fig. 2 vereinfachte Ausfiihrungsf orm und 



Fig. 7 ein Horhilf egerat mit einer erf indungsgemassen 

mehrstufigen Vorrichtung gemass Fig. 2 bis 6. 
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Fig. 1 zeigt eine bekannte einstufige Vorrichtung zum 
Bestimmen der akustischen Umgebungssituation, wobei die 
Vorrichtung aus einer Hintereinanderschaltung von einer 
5 Merkmalsextraktionseinheit F, einer 
Klassif izierungseinheit C und einer 
Nachverarbeitungseinheit P besteht. 

Ein akustisches Bingangs signal IN, das beispielsweise mit 
10 einem Mikronfon aufgenommen wurde, ist der 

Merkmalsextraktionseinheit F beauf schlagt , in der 
charakteristische Merkmale extrahiert werden. 

Fur die Merkmalsextraktion in Audiosignalen wurde im 

15 Aufsatz von J. M. Kates mit dem Titel "Classif ication of 
Background Noises fur Hearing-Aid Applications" (1995, 
Journal of the Acoustical Society of America 97(1), Seiten 
461 bis 469) vorgeschlagen, eine Analyse der zeitlichen 
Pegelschwankungen und des Spektrums vorzunehmen. Des 

20 weiteren wurde in der Europaischen Patentschrif t mit der 
Nummer EP-B1-0 73 2 03 6 eine Analyse des 
Amplitudenhistogramms zur Erreichung des gleichen Ziels 
vorgeschlagen. Schliesslich wurde die Merkmalsextraktion 
auch durch eine Analyse verschiedener 

25 Modulationsf requenzen untersucht und angewendet. 

Diesbezuglich wird auf die beiden Aufsatze von Ostendorf 
et. al. mit den Titeln "Empirische Klassif izierung 
verschiedener akustischer Signale und Sprache mittels 
einer Modulationsf requenzanalyse" (1997, DAGA 97, Seiten 

30 608 bis 609) und "Klassif ikation von akustischen Signalen 
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basierend auf der Analyse von Modulationsspektren zur 
Anwendung in digitalen Horgeraten" (1998, DAGA 98, Seiten 
402 bis 403) verwiesen. Ein ahnlicher Ansatz ist auch in 
einem Aufsatz von Edwards et. al . mit dem Titel "Signal- 
5 processing algorithms for a new sofware-based, digital 
hearing device" (1998, The Hearing Journal 51, Seiten 44 
bis 52) offenbart. Weitere mogliche Merkmale sind der 
Pegel selbst oder die Nulldurchgangsrate wie z.B. in H. L. 
Hirsch, "Statistical Signal Characterization" (Artech 
10 House 1992) beschrieben. Die bisher zur Audiosignalanalyse 
verwendeten Merkmale sind also rein technisch-basiert . 



Des Weiteren wurde in der bereits zitierten 
Of fenlegungsschrift der internationalen Patentanmeldung WO 
15 01/20965 neben den erwahnten technischen Merkmalen 

erstmals auf die vorteilhafte Verwendung von auditorisch- 
basierten Merkmalen hingewiesen. 



Gemass Fig. 1 werden die in der Merkmalsextraktionseinheit 
20 F extrahierten Merkmale M der Klassif izierungseinheit C 
beaufschlagt, in der fur die Gerauschklassif ikation 
grundsatzlich einer der bekannten 

Musteridentif ikationsmethoden zum Einsatz kommt . So eignen 
sich insbesondere so genannte Abstandsschatzer f Bayes 

25 Klassifizierer, Fuzzy Logic Systeme oder Neuronale 

Netzwerke als Mustererkenner . Weitere Inf ormationen zu den 
zwei erst genannten Methoden konnen der Druckschrift 
"Pattern Classification and Scene Analysis" von Richard O. 
Duda und Peter E. Hart (John Wiley & Sons, 1973) entnommen 

30 werden. Beziiglich Neuronalen Netzwerken wird auf das 
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Standardwerk von Christopher M. Bishop mit dem Titel 
"Neural Networks for Pattern Recognition" (1995, Oxford 
University Press) verwiesen. Des weiteren wird auf die 
folgenden Publikationen verwiesen: Ostendorf et. al . , 
5 "Klassif ikation von akustischen Signalen basierend auf der 
Analyse vcn Modulat ionsspektren zur Anwendung in digitalen 
Horgeraten" (Zeitschrift fur Audiologie, 1998, Seiten 148 
bis 150); F. Feldbusch, "Gerauscheerkennung mittels 
Neuronaler Netzwerke" (1998, Zeitschrift fur Audiologie, 

10 Seiten 30 bis 36) ; Europaische Patentanmeldung mit der 

Veroffentlichungsnummer EP-A1-0 814 636; und US- Patent mit 
der Veroffentlichungsnummer US-5 604 812. Neben den 
erlauterten Mustererkennungsmethoden, bei denen lediglich 
die statischen Eigenschaf ten der interessierten 

15 Gerauschklassen modelliert werden, sind in der bereits 
zitierten Of f enlegungsschrif t der internationalen 
Patentanmeldung WO 01/20965 auch Methoden genannt, bei 
denen dynamische Eigenschaf ten berucksichtigt werden. 

20 Gemass Fig. 1 werden durch die in der 

Klassif izierungseinheit C durchgefiihrten 

Verarbeitungsschritten Klasseninf ormation KI erhalten, die 
gegebenenfalls einer Nachverarbeitungseinheit P zur 
allfalligen Bereinigung der Klassenzugehdrigkeit zugefuhrt 
25 werden. Erhalten werden in der Folge bereinigte 
Klasseninf ormationen KI 1 . 

In Fig. 2 ist eine erste Ausfuhrungsvariante einer 
erf indungsgemassen Vorrichtung dargestellt. Es handelt 
30 sich dabei urn eine Vorrichtung mit zwei Verf ahrensstuf en 
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SI und S2, wobei in jeder Verf ahrensstuf e SI, S2 je eine 
Merkmalsextraktionseinheit Fl bzw. F2 und eine 
Klassif izierungseinheit CI bzw. C2 enthalten sind. Beiden 
Verf ahrensstuf en SI bzw. S2 wird das originare 
5 Eingangs signal IN zugefiihrt, namlich sowohl der 
Merkmalsextraktionseinheit Fl als auch der 
Merkmalsextraktionseinheit F2, die je fur sich mit der 
entsprechenden Klassif izierungseinheit CI bzw. C2 in der 
Folge wirkverbunden sind. Von Bedeutung ist nun, dass 
10 Klasseninf ormationen KI1, welche aufgrund von Berechnungen 
in der Klassif izierungseinheit CI der ersten 
Verf ahrensstufe SI erhalten werden, die 

Klassif izierungseinheit C2 der zweiten Verf ahrensstuf e S2 
beeinflusst wird, und zwar derart, dass beispielsweise 
15 einer von mehreren moglichen Muster identif ikationsmethoden 
ausgewahlt wird und fur die Gerauschklassif izierung in der 
Klassif izierungseinheit C2 der zweiten Verf ahrensstuf e S2 
angewendet wird. 

20 Die allgemeine in Fig. 2 dargestellte Ausfiihrungsvariante 
der Brfindung wird im Folgenden an einem konkreten 
Beispiel weiter erlautert : 

Durch die Merkmalsextraktionseinheit Fl werden die 
2 5 Merkmale Tonalitat, spektraler Schwerpunkt (CGAV: spectral 
center of gravity) , Fluktuation des spektralen 
Schwerpunkts (CGFS) und spektrale Breite und 
Einschwingzeit extrahiert und in der 

Klassif izierungseinheit CI, in der ein HMM- (Hidden Markov 
30 Model) -Klassif izierer zum Einsatz kommt, klassif iziert, 



« 
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wobei das Eingangs signal IN mit Hilfe der HMM- 
Kassifizierung in eine der folgenden Klassen eingeteilt 
wird: "Sprache", "Sprache in Rauschen", "Rauschen" oder 
"Musik". Dies wird als Klasseninf ormation KI bezeichnet. 
5 Das Resultat der ersten Verarbeitungsstuf e SI wird der 
Klassifizierungseinheit C2 der Verarbeitungsstuf e S2 
beauf schlagt, in der ein zweites Merkmalset mit Hilfe der 
Merkmalsextraktionseinheit F2 extrahiert wird. Dabei 
werden neben den Merkmalen Tonal i tat, spektraler 

10 Schwerpunkt und Fluktuation des spektralen Schwerpunkts 
(CGFS) das zusatzliche Merkmal Varianz der harmonischen 
Struktur (pitch) - nachfolgend auch etwa als Pitchvar 
bezeichnet - extrahiert. Aufgrund dieser Merkmale wird mit 
Hilfe eines Regel-basierten Klassif izierers in der 

15 Klassifizierungseinheit C2 das Resultat der ersten 
Verarbeitungsstufe SI uberpruft und gegebenenf alls 
korrigiert. Der Regel-basierte Klassif izierer beinhaltet 
lediglich wenige einfache heuristische Entscheidungen, 
welche auf den vier Merkmalen basieren und sich an den 

20 folgenden Uberlegungen orientieren: 



Das Merkmal Tonalitat wird in jeder Klasse zur Korrektur 
verwendet, falls die Merkmalswerte vollstandig ausserhalb 
eines zulassigen Wertebereiches der Klasseninf ormationen 

25 KI1 liegen, welche in der ersten Klassifizierungseinheit 
CI - d.h. durch den HMM-Klassif izierer - bestimmt worden 
sind. Brwartungsgemass ist die Tonalitat fur "Musik" hoch, 
fur n Sprache" im mittleren Bereich, fur "Sprache in 
Rauschen 11 ein wenig tiefer und fur "Rauschen" tief . Falls 

30 beispielsweise ein Eingangs signal IN durch die 

Klassifizierungseinheit CI in die Klasse "Sprache" fallt, 
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dann wird erwartet, dass entsprechende Merkmale, welche in 
der Merkmalsextraktionseinheit Fl ermittelt worden sind, 
der Klassif izierungseinheit CI angezeigt haben, dass der 
relevante Signalanteile im Eingangs signal IN stark 
fluktuiert. Falls, auf der anderen Seite, die Tonalitat 
fur dieses Eingangs signal IN sehr tief ist, handelt es 
sich mit gross ter Wahrscheinlichkeit nicht urn "Sprache", 
sondern urn "Sprache in Rauschen" . Ahnliche Uberlegungen 
konnen fur die anderen drei Merkmale angestellt werden, 
namlich fur die Varianz der harmonischen Struktur 
(Pifcchvar) , den spektralen Scherpunkt (CGAV) und fur die 
Fluktuation des spektralen Schwerpunkts (CGFS) . 
Entsprechend konnen die Regeln fur den Regel-basierten 
Klassif izierer, welche in der Klassif izierungseinheit C2 
zur Anwendung kommen, wie folgt formuliert werden: 
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Klasseninf ormafcion 
KIl : 


Bedingung: 


Klasseninf ormation 


"Sprache " 


Falls Tonalitat tier 
falls CGFS hoch 
una LCsAV nocn 
ansonsten 


" Sprache in Rauschen" 

ft Mi id VH 

"Rauschen" 


"Sprache in Rauschen" 


Falls Tonalitat hoch 
falls Tonalitat fcief 

r>r?*»r* r^JAV hnrh 


11 Sprache" 
"Rauschen" 


" Rauschen" 


Falls Tonalitat hoch 


"Musik" 


"Musik" 


Falls Tonalitat tief 
oder Pitchvar tief 
Oder CGAV hoch 


" Rauschen" 



Bei dieser Ausf uhrungsf orm der Erfindung hat sich in 
uberraschender Weise herausgestellt , dass nahezu die 
gleichen Merkmale in der zweihen Verarbeitungsstuf e S2 
verwendet werden wie in der ersten Verarbeitungsstuf e SI. 
Bs hat sich dariiber hinaus gezeigt, dass sich das Merkmal 
Tonalitat am besten eignet, urn eine Korrektur der durch 
die Klassif izierungseinheit CI erzeugten Fehler 
korrigieren zu konnen. Es kann also festgehalten werden, 
dass bei Verwendung des Regel-basierten Klassif izierers 
die Tonalitat von entscheidender Bedeutung ist. 

Beim Austesten der vorstehend beschriebenen 

Ausf uhrungsf orm konnte festgestellt werden, dass bereits 

bei diesem einfachen zweistufigen Verfahren die 
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Trefferrate mindestens urn 3% gegemiber dem einstufigen 
Verfahren verbessert werden konnte. In einigen Fallen 
konnte sogar eine Verbesserung der Trefferrate urn 91% 
festgesfcellt werden. 

5 

In Fig. 3 ist eine weitere Ausfuhrungsform in allgemeiner 
Darstellung gezeigt. Es handelt sich dabei urn ein 
Verarbeitungsverf ahren mit n Stufen. Jede der 
Verarbeitungsstufen SI bis Sn weist in Fortfuhrung der 

10 vorstehenden Uberlegungen eine Merkmalsextraktionseinheit 
Fl bis Fn und eine dieser nachgeschalteten 
Klassif izierungseinheit CI bis Cn zur Erzeugung der 
jeweiligen Klasseninf ormationen KI1 bis Kin auf . 
Gegebenenf alls ist in jeder oder in einzelnen 

15 Verarbeitungsstufen SI bis Sn eine 

Nachverarbeitungseinheit PI bis Pn zur Erzeugung von 
bereinigten Klasseninf ormationen KI1 ' bis Kin 1 vorhanden. 

In Weiterfuhrung der Ausfiihrungsvariante gemass Fig. 2 
20 eignet sich die in Fig. 3 gezeigte Ausfiihrungsvariante 
insbesondere auch fur eine sogenannte grob-fein 
Klassif izierung. In einer grob-fein Klassif izierung wird 
ein in einer Verarbeitungsstuf e i erhaltenes Resultat in 
einer nachf olgenden Verarbeitungsstuf e i+1 verfeinert. Es 
25 wird also eine Grobklass if izierung in einer ubergeordneten 
Verarbeitungsstuf e vorgenommen, wobei aufgrund der 
Grobklass if izierung eine Feinklassif izierung, basierend 
auf spezif ischeren Merkmalsextraktionen und/oder 
Klassif izierungsmethoden, in einer nachgeordneten 
30 Verarbeitungsstuf e ausgefuhrt wird. Dieser Prozess kann 
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auch als Hypothesengenerierung in einer ubergeordneten 
Verf ahrensstuf e angesehen werden, die in einer 
nachgeordneten Verf ahrensstuf e iiberpruft, d.h. bestatigt 
oder zuriickgewiesen werden. Es wird ausdriicklich darauf 
5 hingewiesen, dass die Hypothesen, welche an sich in einer 
uber geordne t en Ver f ahr ens s t uf e ( Grobklas s i f i z ierung ) 
erstellt worden sind, auch mit anderen Inf ormationen, 
insbesondere mit manuellen Mitteln, wie Fernbedienungen 
oder Schalter, eingegeben werden konnen. In Fig. 3 ist 

10 dies, stellvertretend in der ersten Verarbeitungsstuf e SI, 
mittels einer Stellgrosse ST angegeben, uber die 
beispielsweise die Berechnungen in der 
Klassif izierungseinheit CI iibersteuert werden konnen. 
Selbstverstandlich kann die Stellgrosse auch einer 

15 Klassif izierungseinheit C2 bis Cn oder einer 

Nachverarbeitungseinheit PI bis Pn einer anderen 
Verfahrensstuf e SI bis Sn zugefuhrt werden. 

In einem erf indungsgemassen Klassif izierungssystem mit 
20 mehreren Verarbeitungsstuf en SI bis Sn kann jeder 

Verarbeitungsstuf e SI bis Sn, was jedoch nicht zwingend 
ist, eine Aufgabe zugeordnet werden, wie zum Beispiel: 
eine Grobklassif izierung, eine Feinklassif izierung, eine 
Lokal is ierung einer Gerauschquelle, eine Uberpriifung, ob 
25 eine bestimmte Gerauschquelle, z. B. Automobilgerausch in 
einem Fahrzeug, vorhanden ist, oder eine Extraktion von 
bestimmten Signalanteilen von einem Eingangssignal , z. B. 
Elimination von Echo unter Beriicksichtigung von 
Raumcharakteristiken. Die einzelnen Verfahrensstuf en SI 
30 bis Sn sind daher individuell im Sinne, dass in ihnen 
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verschiedene Merkmale exfcrahiert und verschiedene 
Klassif izierungsmethoden verwendet werden. 

In einem weiteren Anwendungsbeispiel ist vorgesehen, in 
einer ersten Verarbeitungsstuf e SI ein individuelles 
Signal in einem Gemisch von verschiedenen Signalanteilen 
zu lokalisieren, in einer zweiten Verarbeitungsstuf e S2 
eine Grobklassif izierung der lokalisierten Signalquelle 
vorzunehmen und in einer dritten Verf ahrenstuf e S3 eine 
Feinklassif izierung der in der zweiten Verf ahrensstuf e S2 
erhaltenen groben Klassif izierung vorzunehmen. 

Die in der ersten Verarbeitungsstuf e durchgef iihrte 
Lokalisation der Schallquelle kann eine 

Richtungsf ilterung, zum Beispiel mittels Multi-Mikrof on- 
Technologie, nachgeschaltet werden. 

Selbstverstandlich kann eine Merkmalsextraktionseinheit Fl 
bis Fn unter mehreren Klassif izierungseinheiten CI bis Cn 
aufgeteilt werden, d.h. die Resultate einer 
Merkmalsextraktionseinheit Fl bis Fn konnen von mehreren 
Klassif izierungseinheiten CI bis Cn verwendet werden. Des 
weiteren ist denkbar, dass eine Klassif izierungseinheit CI 
bis Cn in mehreren Verarbeitungsstuf en SI bis Sn verwendet 
wird. Schliesslich kann vorgesehen sein, dass die in den 
verschiedenen Verarbeitungsstuf en SI bis Sn erhaltenen 
Klasseninf ormationen KI1 bis Kin bzw. die bereinigten 
Klasseninf ormationen KI1 1 bis Kin' zur Erhaltung der 
abschliessenden Klassif izierung unterschiedlich gewichtet 
werden . 
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In Fig. 4 ist eine weitere Ausf iihrungsf orm der Erfindung 
dargestellt, bei der wiederum mehrere Verarbeitungsstuf en 
SI bis Sn zum Einsatz kommen. Im Unterschied zur 
5 Ausfiihrungsform gemass Fig. 3 werden die 

Klasseninf ormationen KI1 bis Kin nicht nur in den jeweils 
unmittelbar nachf olgenden Verarbeitungsstuf en verwendet, 
sondern gegebenenfalls in alien untergeordneten 
Verarbeitungsstuf en. In analoger Weise konnen die 
10 Resultate von vorhergehenden Verarbeitungsstuf en SI bis Sn 
ihre Auswirkungen auch auf die nachf olgenden 
Merkmalsextraktionseinhei ten Fl bis Fn bzw. auf die zu 
extrahierenden Merkmale haben. 

15 Auch bei der Ausf iihrungsvariante gemass Fig. 4 sind 
Nachverarbeitungseinheiten PI bis Pn denkbar, die 
Zwischenresultate der Klassif izierung aufbereiten und als 
bereinigte Klasseninf ormationen KI1 1 bis Kin 1 zur 
Verfugung stellen. 

20 

In Fig. 5 ist eine weitere Ausf iihrungsvariante einer 
mehrstuf igen Vorrichtung zur Bestimmung der akustischen 
Umgebungs situation, wiederum in allgemeiner Form, 
dargestellt. Gezeigt sind wie bereits bei den 

2 5 Ausfuhrungsvarianten gemass Fig. 3 und 4 mehrere 
Verarbeitungsstuf en SI bis Sn mit 
Merkmalsextraktionseinheiten Fl bis Fn und 
Klassif izierungseinheiten CI bis Cn. Die in jeder 
Verarbeitungsstufe SI bis Sn erhaltenen 

30 Klasseninformationen KI1 bis Kin werden einer 
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Entscheidungseinheit FD zugefiihrt, in der die 
abschliessende Klassif izierung durch erzeugen der 
Klasseninf ormationen KI vorgenommen wird. In der 
Entscheidungseinheit FD ist gegebenenf alls vorgesehen, 
5 Rue kkopp lungs signal e zu erzeugen, welche auf die 

Merkmalsextraktionseinhei ten Fl bis Fn und/oder auf die 
Klassif izierungseinheiten CI bis Cn wirken, urn 
beispielsweise einzelne Parameter in diesen 
Verarbeitungseinheiten anzupassen oder urn ganze 
10 Klassif izierungseinheiten CI bis Cn austauschen zu konnen. 

Es wird ausdrucklich darauf hingewiesen, dass die 
Riickwirkungen und Verknupf ungen der Verarbeitungseinheiten 
der Ausfuhrungs variant en gemass Fig. 3 bis 5 nicht auf die 
15 dargestellten Varianten beschrankt sind. Denkbar ist, dass 
einzelne Riickwirkungen oder Verknupfungen weggelassen 
werden. Grundsatzlich sind beliebige Kombinationen von 
Verarbeitungseinheiten und Strukturen moglich. 

20 Dariiber hinaus ist denkbar, dass - beim Einsatz der 
Erfindung bei Horhilf egeraten - die verschiedenen 
Verarbeitungsstuf en auch zwischen zwei Horgeraten, d.h. 
bei je einem Horgerat fur das linke und das rechte Ohr, 
verteilt sind. Der Inf ormationsaustausch erfolgt bei 

25 dieser Ausfuhrungs form uber eine drahtgebundene oder eine 
drahtlose Ubertragungsstrecke . 



30 



In Fig. 6 ist nochmals eine vereinfachte 
Ausfuhrungsvariante der Erfindung zur Veranschaulichung 
der vorstehenden allgemeinen Ausfuhrungen zu den moglichen 
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Strukturen. Obwohl lediglich eine 

Merkmalsextraktionseinheit Fl vorgesehen ist, sind zwei 
Verarbeitungsstuf en SI und S2 vorgesehen. Die erste 
Verarbeitungsstuf e SI besteht aus der 
5 Merkmalsextraktionseinheit Fl und der 

Klassif izierungseinheit CI. Bei der zweiten 
Verarbeitungsstuf e S2 werden die gleichen Merkmale 
verwendet, die bereits in der ersten Verf ahrensstuf e SI 
verwendet worden sind. Bine Neuberechnung der Merkmale in 

10 der Verf ahrensstuf e 32 eriibrigt sich daher, und es konnen 
die Resultate der Merkmalsextraktionseinheit Fl der ersten 
Verf ahrensstuf e SI in der zweiten Verf ahrensstuf e S2 
verwendet werden. In der zweiten Verf ahrensstuf e S2 wird 
somit lediglich die Klassif izierungsmethode geandert, und 

15 zwar in Abhangigkeit der Klasseninf ormationen KI1 der 
ersten Verarbeitungsstuf e SI. 



Fig. 7 zeigt die Verwendung der erf indungsgemassen 
Vorrichtung bei einem Horhilf egerat , das im Wesentlichen 

20 eine Ubertragungseinheit 200 aufweist. Mit 100 ist eine 
mehrstuf ige Verarbeitungseinheit bezeichnet, die gemass 
einer der in den Fig. 2 bis 6 dargestellten 
Aus fiihrungs variant en realisiert ist. Das Eingangs signal IN 
wird sowohl der mehrstuf igen Verarbeitungseinheit 100 als 

25 auch der Ubertragungseinheit 200 beauf schlagt, in dem das 
akustische Eingangssignal IN unter Zuhilfenahme der in der 
mehrstufigen Verarbeitungseinheit 100 erzeugten 
Klasseninf ormationen KI1 bis Kin bzw. KI1 ' bis Kin' 
bearbeitet wird. Dabei ist vorzugsweise vorgesehen, ein 

30 aufgrund der ermittelten akustischen Umgebungs situation 
ein geeignetes Horprogramm auszuwahlen, wie dies in der 
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Einleitung und in der internationalen Patentanmeldung WO 
01/20 965 beschrieben worden ist. 

Mit 3 00 ist eine manuelle Eingabeeinheit bezeichnet, mifc 
5 Hilfe der - beispielsweise liber eine Funkstrecke, wie dies 
schematisch in Fig. 7 ersichtlich ist - gegebenenf alls 
sowohl auf die mehrstufige Verarbeitungseinheit 100 in 
bereits erlauterten Weise oder auf die Ubertragungseinhei t 
200 einwirkt. Im Falle des Horhilf egerates 200 wird auf 
10 die Ausfiihrungen in der WO 01/20 965 verwiesen, deren 

Inhalt als integrierter Bestandteile dieser Beschreibung 
anzusehen ist. 

Als mogliche Klassif izierungsmethoden bei alien 
15 erlauterten Ausf uhrungsvarianten der Erfindung kommt 

insbesondere eine der folgenden Methoden zur Anwendung: 

- Hidden Markov Modelle; 

- Fuzzy Logic; 

20 - Klassif izierung nach Bayes; 

- Regel-basierte Klassif izierung; 

- Neuronale Netzwerke; 

- Minimale Distanz. 

25 Schliesslich wird ausdriicklich darauf hingewiesen, dass in 
den Merkmalsextraktionseinheiten Fl bis Fn (Fig. 2 bis 7) 
technische und/oder auditorisch-basierte Merkmale 
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extrahiert werden konnen. Fur ausfuhrliche Erlauterungen 
zu den technischen und audi torisch-basierten Merkmalen sei 
wiederum auf die Ausfiihrungen in der internationalen 
Patentanmeldung WO 01/20 955 verwiesen. 

5 

Als bevorzugte Anwendung des erf indungsgemassen Verfahrens 
zur Bestimmung der akustischen Umgebungs situation ist die 
Wahl eines Horprogrammes in einem Horhilf egerat . Denkbar 
ist jedoch auch die Verwendung der erf indungsgemassen 
10 Vorrichtung bzw. die Anwendung des erf indungsgemassen 
Verfahrens zur Spracherkennung . 
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Patentanspriiche : 



1. Verfahren zur Bestimmung einer akustischen 
Umgebungs situation, wobei das Verfahren darin besteht, 
dass in mindestens zwei Verarbeitungsstuf en (SI, Sn) 
ein vorzugsweise mit Hilfe mindestens eines Mikrofons 
aufgenommenes akustisches Eingangs signal (IN) verarbeitet 
wird, und zwar derart, 

- dass in mindestens einer der mindestens zwei 
Verarbeitungsstuf en (SI, . . . , Sn) eine 
Extraktionsphase vorgesehen ist, in der 
charakteristische Merkmale aus dem Eingangssignal 
(IN) extrahiert werden, und 

- dass in jeder Verarbeitungsstuf e (SI, Sn) eine 
Identif ikationsphase vorgesehen ist, in der 
extrahierte charakteristische Merkmale klassif iziert 
werden, 

wobei aufgrund der Klassif izierung der Merkmale in 
mindestens einer Verarbeitungsstuf e (SI, . .., Sn) 
Klasseninformationen (KI1, . . . , Kin; KI1 ■ , . . . , Kin' ) 
erzeugt werden, welche die akustische Umgebungssituation 
charakterisieren bzw. identif iziert . 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dass 
in jeder Verarbeitungsstuf e (SI, Sn) eine 
Extraktionsphase vorgesehen ist, in der charakteristische 
Merkmale aus dem Eingangssignal (IN) extrahiert werden. 
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3 . Verf ahren nach Anspruch 1 oder 2 , dadurch 
gekennzeichnet , dass aufgrund von in einer 
Verarbeitungsstuf e (SI, Sn) erhaltener 

Klasseninf ormafcionen (KI1, . . . , Kin; KI1' , . . . , Kin' ) die 
Art der Verarbeitung in einer anderen Verarbei tungsstuf e 
(SI, . . . , Sn) gewahlt wird. 

4. Verf ahren nach Anspruch 2 oder 3, dadurch 
gekennzeichnet, dass die in der Identif ikationsphase einer 
Verarbeitungsstuf e i (SI, Sn) erhaltenen 
Klasseninformationen (KI1, Kin; KI1 ' , Kin') die 
Art der Verarbeitung in der nachf olgenden bzw. 
untergeordneten Verarbei tungsstufe i+1 (SI, Sn) 
bestimmen . 

5. Verf ahren nach Anspruch 4, dadurch gekennzeichnet, dass 
aufgrund der in der Verarbeitungsstuf e i (SI, Sn) 
erhaltenen Klasseninformationen (KI1, Kin; KI1 1 , 
Kin') spezifische Merkmale in der Extraktionsphase der 
nachf olgenden bzw. untergeordneten Verarbeitungsstuf e i+l 
(SI, Sn) und/oder spezifische 

Klassif izierungsverf ahren in der Identif ikationsphase der 
nachf olgenden bzw. untergeordneten Verarbeitungsstuf e i+1 
(SI, . . . , Sn) gewahlt werden. 

6. Verf ahren nach einem der vorangehenden Anspruche, 
dadurch gekennzeichnet, dass in der Identif ikationsphase 
eines der folgenden Klassif izierungsverf ahren zutn Einsatz 
kommt : 
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- Hidden Markov Modelle; 

- Fuzzy Logic; 

- Klassif izierung nach Bayes; 

- Regel-basierte Klassif izierung; 

- Neuronale Netzwerke; 

- Minimale Distanz. 

7. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet , dass in den Extraktionsphasen 
technische und/oder auditorisch-basierte Merkmale 
extrahiert werden. 

8. Verfahren nach einem der vorangehenden Anspriiche, 
dadurch gekennzeichnet, dass in mindestens einer 
Verarbeitungsstuf e (SI, Sn) im Anschluss an die 
Extraktionsphase eine Nachverarbeitungsphase vorgesehen 
ist, in der die Klasseninf ormationen (KI1, . . . , Kin) zur 
Erzeugung von bereinigfcen Klasseninf ormationen (KI1 1 , 
Kin') nachbearbeitet werden. 

9. Anwendung des Verfahrens nach einem der Anspriiche 1 bis 
8 zur Anpassung mindestens eines Horhilf egeraces an eine 
momentane akustische Umgebungssi tuation. 

10. Anwendung nach Anspruch 9, dadurch gekennzeichnet, 
dass aufgrund der ermittelten momentanen akustischen 
Umgebungssituation ein Horprogramm bzw. eine 
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(ifoertragungsfunktion zwischen mindestens einem Mikrcfon 
und einem Horer im mindestens einen Horhilf egerat 
eingestellt wird. 

11. Anwendung des Verfahrens nach einem der Anspruche 1 
bis 8 zur Spracherkennung . 

12. Vorrichtung zur Bestimmung einer akustischen 
Umgebungs situation mit einer Merkmalsextraktionseinheit 
(M) , das mit einer Klassif izierungseinheit (C) zur 
Verarbeitung eines Eingangssignals (IN) wirkverbunden ist, 
dadurch gekennzeichnet, dass mindestens zwei 
Verarbeitungsstufen (SI, Sn) vorgesehen sind, wobei 
in mindestens einer der mindestens zwei 
Verarbeitungsstufen (SI, Sn) eine 

Merkmalsextraktionseinheit (Fl, . .., Fn) enthalten ist und 
wobei in jeder Verarbeitungsstuf e (SI, . .., Sn) eine 
Klassif izierungseinheit (CI, . .., Cn) enthalten ist, dass 
das Eingangs signal (IN) den Merkmalsextraktionseinheiten 
(Ml, Mn) beaufschlagt ist und dass mit den 

Klassif iziereinheiten (CI, Cn) Klasseninf ormationen 

(KI1, . . . , Kin) erzeugbar sind. 

13. Vorrichtung nach Anspruch 12, dadurch gekennzeichnet , 
dass in jeder Verarbei tungsstuf e (SI, Sn) eine 
Merkmalsextraktionseinheit (Ml, Mn) vorgesehen ist. 

14. Vorrichtung nach Anspruch 12 oder 13, dadurch 
gekennzeichnet, dass die Klasseninf ormationen (KI1, 



1 

ft 

WO 02/32208 PCT/CH02/00049 ! 

- 25 - 

Kin; KI1 ' , . . . , Kin 1 ) einer anderen Verarbei tungsstufe 
(SI, . .., Sn) beaufschlagt sind. 

_ 4 

15. Vorrichtung nach einem der Anspruche 12 bis 14, ; 
5 dadurch gekennzeichnet, dass die Klasseninf ormationen 

(KI1, . . . / Kin; KI1 1 , . . . , Kin' ) einer Verarbei tungsstuf e 
i (SI, Sn) der nachf olgenden bzw. ubergeordneten 

Verarbeitungsstuf e i + 1 (SI, Sn) beaufschlagt sind. 

10 16. Vorrichtung nach Anspruch 15, dadurch gekennzeichnet, 

dass die Klasseninf ormationen (KI1, . . . , Kin; KI1 ■ , . . . , 

Kin') einer Verarbeitungsstuf e i (SI, Sn) der 

Merkmalsextraktionseinheit (Ml, . . . , Mn) einer 

nachf olgenden bzw. untergeordneten Verarbeitungsstuf e i+1 
15 (SI, Sn) und/oder der Klassif izierungseinheit (CI, 

Cn) der nachf olgenden bzw, untergeordneten 

Verarbeitungsstuf e i+1 (SI, Sn) beaufschlagt sind. 

17. Vorrichtung nach einem der Anspruche 12 bis 16, 
20 dadurch gekennzeichnet, dass in mindestens einer 

Verarbeitungsstuf e (SI, Sn) die erhaltenen 

Klasseninf ormationen (Kll, Kin) einer 

Nachverarbeitungseinheit (PI, Pn) zur Erzeugung von 

bereinigten Klasseninf ormationen (Kll ' , . . . , Kin 1 ) 
25 beaufschlagt sind. 

18 . Vorrichtung nach Anspruch 12 Oder 13 , dadurch 
gekennzeichnet, dass die Klasseninf ormationen (Kll, 
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Kin) aller Verarbeitungsstuf en (SI, . .., Sn) einer 
Entscheidungseinheit (ED) beaufschlagt sind. 

19. Vorrichtung nach Anspruch 18, dadurch gekennzeichnet , 
dass die Entscheidungseinheit (ED) mit mindestens einer 
Merkmalsextraktionseinheit (Fl, . .., Fn) und/oder mit 
mindestens einer Klassif izierungseinheit (CI, . .., Cn) 

wi r kverbunden i s t . 

20. Horhilf egerat mit einer fiber tragungseinheit (200), die 
eingangsseitig mindestens mit einem Mikrofon und 
ausgangsseitig mit einer Wandlereinheit , insbesondere 
einem Horer, wirkverbunden ist, und mit einer Vorrichtung 
nach einem der Anspruche 12 bis 17 zur Erzeugung von 
Klasseninformationen (Kll, . . . , Kin; Kll' , . . . , Kin 1 ) , 
wobei die Klasseninformationen (Kll, . . . , Kin; Kll 1 , . . . , 
Kin 1 ) der fiber tragungseinheit (200) beaufschlagt sind. 

21. Horhilf egerat nach Anspruch 20, dadurch 
gekennzeichnet, dass eine Eingabeeinheit (300) vorgesehen 
ist, die, vorzugsweise iiber eine Funkstrecke, mit der 
fibertragungseinheit (200) und/oder mit der Vorrichtung 
nach einem der Anspruche 12 bis 17 wirkverbunden ist. 
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